9月1日消息 ,美團LongCat-Flash采用創(chuàng)新性混合專家模型(Mixture-of-Experts,發(fā)布 MoE)架構,在智能體任務中具備突出優(yōu)勢,并開激活參數(shù)18.6B-31.3B(平均27B) ,美團總參數(shù)560B
9月1日消息 ,美團LongCat-Flash采用創(chuàng)新性混合專家模型(Mixture-of-Experts,發(fā)布 MoE)架構,在智能體任務中具備突出優(yōu)勢,并開激活參數(shù)18.6B-31.3B(平均27B) ,美團總參數(shù)560B